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Что такое и зачем нужен МУСС 


Ми -уегзюп сопсиггепсу сотго! 


Купи батон хлеба; если будут 
яйца - возьми десяток. 


Тагап®оо! д Яндекс 


Купи батон хлеба; если будут 
яйца — возьми десяток яиц. 


Тагап®оо! 5 Яндекс 


Более сложная программа 


Если будет белый хлеб - возьми, если нет - возьми 
половинку черного. 


Если будет молоко, яйца и мука - возьми (будем блины 
печь), но если чего-то не будет - не бери ничего (не 


сможем блины печь). 


Если будут чипсы со скидкой - возьми три пакета, но 
один пакет - в любом случае. 


Тагапфоо! 6 Яндекс (нь) Ниньоаа"* 


Человек - разумный исполнитель 


Что будет, если что-то пойдет не так? 


ы Одновременно два исполнителя, а пакет молока - всего один. 
. Скидка прекратится, пока исполнитель идет к кассе. 


Тагапеоо! › Яндекс (нг) Меньоая“ 


Жизненный пример у$ мир ИТ 


Отличия мира ИТ 


. Исполнитель - максимально тупой. 

. Все происходит очень быстро. 

‚ Объекты, как правило, эфемерны.. 
Сложно на ходу “дописать программу”. 


Тагапеос! з Яндекс (не) нньоаа“ 


Жизненный пример у$ мир ИТ 


Что же общего 


. Работа с изменчивым внешним миром. 
‚ Мы хотим писать простые программы. 


Тагапфоо! о Яндекс (м) НИвньоаа" 


Борьба с изменчивостью 


Как в реальном мире максимально упростить жизнь покупателю? 
Может сделать так, чтобы никого не было? Варианты: 
. Вход в магазин строго по одному (включая менеджеров). 


. Подход к полке строго по одному. 
. Подход к товару строго по одному. 


Тагапеос! 'ю Яндекс (не) Наньоаа“ 


Борьба с изменчивостью 


Применимо ли это в мире ИТ? Да пожалуйста. 
Мы только что изобрели блокировки! 

. Блокировать всю базу данных. 

. Блокировать таблицу. 


 Блокировать одну запись. 
‚ Блокировать диапазон записей. 


Тагапфоо! и Яндекс (не) неньоаа” 


Миу@уегзюоп сопсиггепсу сот го! 


А можно иначе? В ИТ - можно! 
Покупатель 3 


Покупатель 2 


Покупатель 1 


Быстро создаем каждому покупателю свой магазин. 
На кассе быстро пересчитываем и дропаем неудачников. 


Тагапфоо! 12 Яндекс 


Миу@уегзюоп сопсиггепсу сот го! 


Особенности 


‚ Каждый видит свою реальность. 

‚ Каждый видит только свои изменения реальности. 

. Нет ожидания. 

‚ Кассир на выходе повторяет и сверяет все действия 
покупателя в настоящей реальности. 


Тагапфоо! 'з Яндекс (м) Неньоаа" 


Миу@уегзюоп сопсиггепсу сот го! 


Особенности 


. Покупателей, у которых "не получилось” - нигде не фиксируем. 
. Сточки зрения кассовой книги все покупатели приходили 


строго последовательно. 
. Покупатель "я только посмотреть” гарантированно видел 
какой-то момент в настоящей реальности. 


Тагапеос! « Яндекс (не ННоаа** 


МУСС в СУБД 


Польза 


. С правильным менеджером конфликтов (кассиром) -— 
изоляция транзакций. 


. Нет блокировок. 
. Можно бесконечно долго рассматривать состояние на данный 


момент времени. 


Тагапеос! '5 Яндекс (не) неньоаа“ 


М\УСС в СУБД 


Недостатки 


. Могут попросить “повторить”, причем потенциально 
неизвестно сколько раз. 

. На поддержку параллельных реальностей тратятся ресурсы. 

. Подход сложнее в разработке. 


Тагапеос! ‘в Яндекс (не) наньоаа” 
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Как (может быть) устроен МУСС 
в дисковых БД 
Обзор 


Дисковые БД 


Особенности 


. Начало берут с древних времен. 
‚ Высокая стоимость чтения/записи случайных данных. 
. Низкая стоимость последовательного чтения/записи. 
. Дисковое пространство дешево. 


Тагапеос! ‘в Яндекс (не) Неньоаа” 


Дисковые БД 


Особенности 


. Необходима асинхронность работы транзакций. 

. Ориентация на блоки данных. 

‚ Тенденция к упорядоченному хранению. 

. Общая нагрузка на БД не очень высока. 

. Низкие требования к алгоритмам для локальных данных. 


Тагапеос! ', Яндекс (не) Наньоаа“ 


Дисковые БД 


Тагапфоо! ю Яндекс (НГ) Нунисаа" 


Дисковые БД 


Таблички-указатели 
Молочные Хлеб Чай/кофе 
НЙ ыы 


Плюшка московская — 2шт 


Тагапфоо! >» Яндекс (НГ) Нуньсаа" 


Дисковые БД 


Индекс 


Блок данных Блок данных Блок данных 
индекса индекса индекса 


Тагапфоо! ‚> Яндекс (НС) Нуньоая 


Сохранение копии данных: Б-дерево 
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Тагапфоо! ьз Яндекс (НЕ) Нньоая 


Как можно реализовать МУСС 


Хранить копию данных. Хранить историю изменений. 


24 Яндекс (НЕ) Наныхаа“" 


Сохранение копии данных 


Тагапфоо! > Яндекс (НЕ) Нныоая 


Сохранение копии данных 


Главный индекс 
Блок данных Блок данных Блок данных 
Копия блока 


| 


Копия индекса 


Тагапфоо! в Яндекс (м) Неньоаа" 


Удаление копии данных 


Главный индекс 


| | | 


Блок данных Блок данных Блок данных 
<мусор> 


| 


Тагап®оо! 27 Яндекс (НЕ) Манысаа“" 


Сохранение копии индекса 


Индекс 


Блок данных Блок данных Блок данных 
индекса индекса индекса 


Тагапфоо! в Яндекс (НЕ) Нньоая 


Сохранение копии индекса 


Индекс 


Блок данных Блок данных Блок данных 
индекса индекса индекса 


Копия блока 
данных 


Копия индекса 


Тагапфоо! >э Яндекс (НГ) Нуньсаа" 


Сохранение копии данных: Б-дерево 
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И Лист Г Лист те 


Тагапфоо! зо Яндекс (НЕ) Нньоая 


Сохранение копии данных: Б-дерево 
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Тагапеоо! Яндекс (НГ) Нуньсаа" 


Сохранение копии данных 


Плюсы, минусы и свойства 


. + Понятный и надежный механизм. 

‚ + Минимум нагрузки на СРЧУ. 

‚ - На каждое изменение может быть скопирован блок данных. 
. - Часто приходится копировать Н блоков (высота дерева). 


Тагапеоо1 з> Яндекс (не) нениоаа” 


Сохранение копии данных 


Плюсы, минусы и свойства 


. - Возможна ошибка "недостаточно места” при удалении. 
. - Долгая транзакция легко сожрет х2 данных. 

. +Неизменную копию можно читать из тредов. 

. + На диске место дешево. 


Тагапфоо! зз Яндекс (м) НИеньоаа" 


Сохранение истории изменений 


Основные принципы 


. Вместо изменения данных - информация об изменении. 
. Вместо удаления - добавление "надгробия". 

. При чтении разбирается история. 

История упорядочивается по времени и/или $М. 


Тагапеоо1 « Яндекс (нь) Неньова” 


Сохранение истории изменений 


Основные принципы 
‚ Важно хранить всю историю одного ключа рядом. 


. Фактически ЗМ становится компонентом индекса. 
Периодически историю нужно “сжимать”. 


Тагапеос! з5 Яндекс (нЕ) Неньоаа“ 


Сохранение истории изменений 


| | | 


Батон нарезной: 


Плюшка московская: 
6:00 было 2 шт, 
11:01 стало 1 шт. 


6:00 было 100 шт, 
10:45 стало 98 шт, 
11:01 стало 97 шт. 


Тагапфоо! зв Яндекс (НГ) Нунисаа" 


Сохранение ыы изменении: [$М-дерево 


[| _ Индекс __\ 


[ м 0: тесете _| Блок | Блок | гесет | Блок | Блок выЕЕе/” ^ 


Тагапфоо! 37 Яндекс (НС) Нуньоая 


Сохранение истории изменений 


Минусы 


. Довольно сложный механизм. 

. Усложняется и удорожается обычное чтение. 

. Хуже сочетается с многопоточным доступом. 

. Возможна ошибка "недостаточно места” при удалении. 


Тагапфоо! зв Яндекс (м) Неньоаа" 


Сохранение истории изменений 
Плюсы 


. Экономичный для диска метод. 
. Идеально подходит для [$М-деревьев. 


Тагапфоо! зэ Яндекс (м) Нвньоаа" 
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Как (может быть) устроен МУСС 
в т-тетогу БД 


Плюсы и минусы 


БД в памяти 


Особенности 


. Относительно новое веяние. 

Много наработок сворованы из дисковых БД. 
. Память работает очень быстро. 

. Работа с указателями. 


Тагапкос! и Яндекс (не ННоаа*" 


БД в памяти 


Особенности 


Память очень дорогая. 

.‚ Предполагается высокая нагрузка на БД. 

. Высокие требования к алгоритмам. 

. Надежность данных (запись на диск) никто не отменял. 


Тагапеоо1 = Яндекс (нь) Ниеньова” 


БД в памяти 


Пример адаптации Б-дерева для т-тетогу БД 


‚ Нет данных (в т.ч. ключей), только указатели на данные. 
‚ Специальный аллокатор. 

. Трансляция адресов. 

‚ Бх-дерево. 


Тагапеоо1 з Яндекс (нь) ниеньова” 


МУСС для БД в памяти 


Способы реализации 
. Адаптация алгоритмов из дисковых БД. 


. Применение алгоритмов со случайным доступом к памяти. 
‚ Запретить асинхронность. 


Тагапфоо! .„ Яндекс (нв) Неноаа“* 


Запретить асинхронность 


Вход - строго по одному! 


‚ Каждая следующая транзакция не начинается, пока не 
закончится предыдущая. 

. В транзакции запрещено всё сложное, например 1/0. 

. После сот! и начала записи в \/АЕ - транзакция видна. 

. Сбой МИАЕ может привести к грязным чтениям. 

. Это - не МУСС. 


Тагапеоо! = Яндекс (нг) Неныоаа“ 


Сохранение копии данных: трансляция адресов 
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Тагапфоо! 4 Яндекс (НЕ) Нньоая 


Сохранение копии данных: трансляция адресов 
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Тагапеоо! 7 Яндекс (НГ) Нуньсаа" 


Сохранение копии данных: таа$ 


Мага$ - Метогу Адагез$ ТКапз!айоп АПоса{ог ($?). 


‚ Аллокатор с трансляцией адресов и Со\\. 
 МУСС для любой структуры данных. 

. Аллоцирует блоки заданного размера (2^п). 
. Для данного читателя отображает 10 блока -» блок. 
. Подробнее - по ссылке в ОВ-коде. 


Тагапфоо! з Яндекс (м) Неньоаа" 


Сохранение копии данных: геад ме\м 


Опять специальный аллокатор 


. Аллокатор общего назначения. 

. Объект всегда доступен по указателю. 

. Откладываем фактическое удаление объекта (если надо). 
‚ Накладные расходы - и!{32_ в каждом объекте. 


Тагапфоо|! 4э Яндекс НЕ. Неноаа“* 


Сохранение копии данных: геаа мем/ 


создание удаление 
® ® 


читатель версии 


Тагапфоо! ьо Яндекс (НГ) Нунисаа" 


Сохранение копии данных: геаа мем/ 


Тагапфоо! ыз Яндекс (НГ) Нунисаа" 


Сохранение копии данных: геаа мем/ 


Тагапфоо! 5> Яндекс (НГ) Нунисаа" 


Сохранение копии данных: геаа мем/ 


Тагапфоо! 5з Яндекс (НГ) Нунисаа" 


Сохранение копии данных: геад ме\м 


Основные принципы 


. При удалении объект может быть отдан в геа4 мем.. 

. Угеаа мем/ много списков для оптимизации его уничтожения. 

. При уничтожении геад ме\м/ какие-то списки удаляем, какие-то 
переносим в соседний геад ме\\. 

‚ Списки интрузивные (перезатирается версия и еще пара не 


очень нужных полей). 
° Сложность удаления геаа мем - О(количество геа4 мем\). 


Тагапеоо! =» Яндекс (нг) Неныоаа“ 


Веа4 мем/ — пример 


сСагапсоо1> Бох.врасе.ЕезЕ:зе1есЕ{ } 


г = [, ‘ОЕ " 


= [2х Тапосвее орон ат "| 
сагап®оо1> гу = рох.геаа у1лем.ореп () 


Тагап®оо1> Бох.зрасе .Еезе :Аае1еёе{2} 


Сахапеоо1> Бох. расе .тезе:1п5еи®{3, ‘'пем'} 


Тагапфоо! 55 Яндекс (нь) Ниньоаа"* 


Веа4 мем/ — пример 


сСагапсоо1> Бох.врасе.ЕезЕ:зе1есЕ{ } 


= [[, ‘ОН " 


- [3, "'пем'] 
сахапЕоо1> ту. расе. сезЕ: зе1есЕ] } 


Е я ПО 


= |2, Тапоенее огтетнаЕ" | 


(©) Тагапкоо! 56 Яндекс (нь) Ниеньоаа” 


Сохранение копии данных: геад ме\м 


Итого 


. Разные алгоритмы для индексов и данных. 

. Отличная алгоритмическая сложность. 

. Дешево по памяти. 

. Кеаа мем/ доступен из тредов без синхронизации. 
. Подходит только для геад-оту операций. 


Тагапеоо1 57 Яндекс (нЕ) Ниеньоаа” 


Сохранение истории изменений 


Основные принципы 


. В отличие от дисковых БД историю можно делать списком. 
. Не реализовывать для каждого типа индекса. 

‚ Не пользуешься - не платишь. 

. Алгоритм должен быть алгоритмически простым. 


Тагапфоо! 5 Яндекс (м) НИвньоаа" 


Сохранение истории изменений 


Индекс 
О О ОО ГО ГО О О О О ОО О ОИ ООО О ОО ОО О О 


100, зоте ааа 102, тоге ааа 


101, опдта! даа 
Тагапфоо! 55 Яндекс (НГ) Нунисаа" 


Сохранение истории изменений 


Индекс 
"р Сие СЕВА | ЕО ОО В ЕЕ ПИ ЕЕ ПОВ || По | ЗЕЕ В | Зе | ЗЫ 


100, зоте даа /) 102, тоге даа 
101, пем даа ООО 


101, опата! ааа № 
Тагапфоо! о Яндекс (НГ) Нуна" 


Сохранение истории изменений 


Основные принципы 


. В каждом кортеже может стоять бит о том, что есть история. 

° Связь кортеж -> история - 0(1) всегда. 

. История содержит изменения, чтения как конкретно этого 
кортежа, так и ключей рядом. 

. При чтении чистого кортежа - всё просто, грязного - 
разгребаем историю. 

. Считаем, что история невелика. 


Тагапеос! 5 Яндекс (не) Неньоаа“ 


Сохранение истории изменений 


Тагаптоо!: уровень изоляции зепа|хаЫе, но не зпарзпо\{ 


‚ Пользователю нужен не снапшот на какое-то конкретное 
время, ему нужна консистентность. 

. Чем позже снапшот - тем дешевле и меньше конфликтов. 

Менеджер конфликтов дает плавающий снапшот, 
фиксирующийся при конфликте. 

Опции транзакции позволяют создавать снапшот из 
неподтвержденных данных. 


Тагапфоо! с> Яндекс (нь) Ниеньова” 


Сохранение истории изменений 


Итоги 


‚ МУСС для менеджера транзакций. 

. оепа|хаЫе уровень изоляции. 

. Сложность ограничена длиной истории. 

. Никакого дополнительного поиска, кроме прыжка 
кортеж -> история (ну и шагов по истории). 

. Подробнее про менеджер транзакций - ОК-код. 


Тагапфоо! з Яндекс (НГ) Нуньсаа" 


/Полезные/ссылки про Тагап{юо! 
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57 Яндекс (не ННГоаа** 
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